{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 百面机器学习"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "- 主编：诸葛越"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 特征工程"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "**核心观点**\n",
    "- Garbage in, garbage out.\n",
    "- 数据和特征决定了结果的上限\n",
    "- 模型和算法只是在不断接近这个上限\n",
    "- 特征工程：将原始数据提炼为特征，供算法和模型使用\n",
    "\n",
    "**两种数据类型**\n",
    "- 结构化数据：类似于关系型数据库中的一张表，每列都有清晰的定义，每行表示一个样本\n",
    "- 非结构化数据：文本，图像，音频视频等等，没办法用一个数一张表来简单表示\n",
    "\n"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "#### 特征归一化"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": []
  }
 ],
 "metadata": {
  "language_info": {
   "name": "python"
  },
  "orig_nbformat": 4
 },
 "nbformat": 4,
 "nbformat_minor": 2
}
